DeepSeek V4 发布,全网最细解读 & 技术报告拆解
DeepSeek V4 发布,全网最细解读 & 技术报告拆解Agentic Coding 评测里 V4-Pro 已经到当前开源最佳水平。DeepSeek 公司内部已经把 V4 作为默认编码模型,反馈是优于 Sonnet 4.5,交付质量接近 Opus 4.6 的非思考模式,和 Opus 4.6 的思考模式还有差距。这次还专门为 Claude Code、OpenClaw、OpenCode、CodeBuddy
Agentic Coding 评测里 V4-Pro 已经到当前开源最佳水平。DeepSeek 公司内部已经把 V4 作为默认编码模型,反馈是优于 Sonnet 4.5,交付质量接近 Opus 4.6 的非思考模式,和 Opus 4.6 的思考模式还有差距。这次还专门为 Claude Code、OpenClaw、OpenCode、CodeBuddy
今天介绍 Claude Code 上线的一个新功能:/ultrareview。一句话概括:它会在云端同时派出多个 AI 审查员,帮你在合并代码之前把 Bug 揪出来。这个功能其实在上周 Claude Opus 4.7 发布时就提到了,当时 Anthropic 在发布公告里写的是:
Anthropic 在私募二级市场被追到接近 1 万亿美元,热度反超 OpenAI,背后是稀缺股权、收入增长、Claude Code 的产品势能,以及资本对 AI 平台入口的重新下注。
就在今天,Anthropic 一度偷偷地将 Claude Code 从 Pro 套餐页面移除,引发开发者广泛不满。数小时后,官网页面回滚,负责人称本次仅为小范围测试。但本次事件传递出的信号十分明确:高消耗的 AI 编程代理正逼迫平台重写订阅规则,Claude Code 转向 Max 或按量计费的可能性正在上升。
在 skills.sh 上闲逛的时候,我刷到了一个有意思的技能:chinese-novelist-skill,专门用来写中文小说的(地址:https://skills.sh/penglonghuang/chinese-novelist-skill/chinese-novelist)。
browser-use 团队最近开源了一个叫 video-use 的 Claude Code 技能。
最近很多朋友都在问我,能不能出一期Claude Code的小白教程。
ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。
最近几个月,Vibe Coding(氛围编程)是一大刷屏热词。以 Cursor 和 Claude Code 为代表的一批工具,正在将软件开发效率推向新的高度。
前几天,Anthropic 开源了 claude-desktop-buddy,用一块小屏幕显示 Claude Code 里 Buddy 的状态。结果做着做着,它变成了一个完全不同的东西:M5 Paper Buddy (https://github.com/op7418/m5-paper-buddy)。